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不 协调 决策 信息 系统 的 知识 约 简 及 决策 规则 优化 研究 
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摘 要 : 针对 不 协调 决策 信息 系统 的 知识 约 简 及 决策 规则 的 优化 问题 ， 引 入 分 布 约 简 和 最 大 分 布 约 简 理 论 ， 提 出 一 种 
基于 分 布 区 分 对 象 集 的 知识 约 简 算法 ， 并 得 到 具体 的 优化 决策 规则 获取 方法 。 该 算法 通过 求解 分 布 区 分 对 象 集 和 最 小 
析 取 范式 从 而 得 到 知识 约 简 集 ， 依 据 属性 约 简 集 挖掘 出 最 优 决策 规则 集 。 理 论 分 析 和 实例 结果 表明 该 方法 的 有 效 性 和 
实用 性 。 
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Abstract: For the knowledge reduction and optimization decision rules of the inconsistent decision information system, by 
introducing distribution reduction and maximum distribution reduction theory, a knowledge reduction algorithm based on 
distribution set of objects is proposed in this paper, and approach optimal decision rule sets . The algorithm approach knowledge 
reduction sets by solving distribution set of objects and minimum disjunctive normal form, and mining optimal decision rules. 
Theoretical analysis and example results show that the method is effective and practical. 
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引入 差别 和 矩阵， 深入 探讨 了 不 协调 决策 系统 属性 约 简 算法 。 随 
¢ 着 系统 数据 集 的 不 断 增加 ， 这 些 算法 复杂 度 逐 步 增 大 。 为 了 解 
:二 粗糙 集 理论 是 一 种 处 理 不 精确 、 不 确定 和 噪声 数据 的 有 力 ” 决 这 些 算 法 中 存在 的 问题 ， 史 德 容 等 引入 优势 关系 ， 研 究 了 不 
区 工具 ， 已 被 广泛 应 用 于 决策 分 析 、 信 息 处 理 、 数 据 挖掘 、 模 式 ”协调 区 间 值 模糊 序 信息 系统 的 分 布 约 简 和 最 大 分 布 约 简 算法 等 


0 引言 


识别 等 领域 中 中 4。 053。 如 何 高 效 从 决策 信息 系统 进行 属性 约 简 和 获取 最 优化 的 规 
不 确定 信息 下 的 知识 挖掘 是 粗 集 理论 研究 的 重要 问题 之 一 。 则 知识 ， 一 直 以 来 是 研究 人 员 共 同 面 对 的 问题 。 

为 了 从 不 确定 信息 系统 中 挖掘 更 为 优化 的 决策 知识 ， 关 键 需要 为 此 ， 本 文 在 现 有 不 协调 决策 信息 系统 属性 约 简 方法 基础 

对 决策 系统 进行 约 简 。 目 前 ， 众 多 学 者 们 对 属性 约 简 和 知识 控 ”上 ， 通 过 引入 分 布 约 简 和 最 大 分 布 约 简 的 概念 ， 具 体 分 析 了 不 


掘 理论 开展 了 大 量 的 研究 工作 。 如 张 文 修 等 在 研究 知识 约 简 及 ”协调 决策 信息 系统 下 的 分 布 约 简 和 最 大 分 布 约 简 理论 ， 在 此 
决策 规则 挖掘 时 ， 引 入 了 区 分 函数 方法 钻 ，Kryszkiewicz 岂 提出 础 上 ， 构 造 了 一 种 基于 分 布 区 分 对 象 集 的 属性 约 简 算法 ， 算 法 
了 相对 约 简 概念 ， 并 给 出 具体 的 决策 规则 提取 方法 ， 文 献 [5] 在 。” ”利用 分 布 区 分 对 象 集 的 集 对 ， 计 算 最 小 析 取 范式 得 到 属性 约 简 
分 析 集 值 信息 系统 的 属性 约 简 及 知识 获取 问题 时 ， 基 于 容 差 关 ”结果 ， 并 挖掘 出 优化 的 决策 规则 集 。 最 后 ， 利 用 实例 分 析 验 证 
系 和 引入 极 大 一 致 块 方法 等 。 上 述 研究 大 都 面向 协调 信息 系统 了 算法 的 有 效 性 和 合理 性 。 
进行 以 铸 握 增加 、 重 要 信息 缺损 以 及 噪 表 干枯 每 

进行 的 。 由 于 数据 增加 、 重 要 信息 缺损 、 以 及 噪声 干扰 因素 等 ， 1 ”不 协调 决策 信息 系统 


ill 


上 上 


nl 
T 
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导致 数据 集 不 一 致 ,大 量 决策 信息 系统 都 是 不 协调 的 .近年 来 ， 

不 协调 决策 信息 系统 得 到 广泛 研究 (1。 如 Kryszkiewicz 率先 定义 1 设 (V0,4,f,d) 为 决策 信息 系统 ， 
提出 了 分 布 约 简 和 分 配 约 简 概念 ， 但 是 尚未 详细 研究 属性 约 简 Ra={(X,x)| fx)= fx)a, € A)} ， 
算法 由。 张 文 修 等 人 HI 对 前 人 的 研究 结论 进行 了 拓展 和 延伸 ， R={(6,)|4(%)=d(x)} ,车 R& ER， 则 称 (U,A,F,d) 是 协 
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录用 稿 


调 的 ， 铬 RF Rl， 则 称 (U,A,F,d) 是 不 协调 的 。 
设 (U,A,f,d) 为 决策 信息 系统 ， 
Rs ={(x,x)| f(x)= f(x)(a, eB)}B cA), 
U/Rs={[x]s|x eU},U/R,={D,D,,……D,)} 
其 中 [x]s ={%) Go) e Rs}。 


|D, [x,ls| ; 
对 VxeU,， BOO (j<7r), 则 UV 上 
关于 B 的 分 布 函 数 、 最 大 分 布 函 数 、 分 配 函 数 定义 为 
Hs(X;)= (DD /[x]s), DCD, / [x]s),*…, DCD, / [x;]s)) ， 


(x eU) 上 


178(X:) 二 {Do | DCLDino / [x]s)} = max D(D, / [xX];) > 


(x eU) (2) 
65(%)={D;|D; Nxl]s #8}, (x eU) (3) 
定义 202490 ” 设 (U,A,f,d) 为 决策 信息 系统 ，BSA4。 
a) 对 VX eU ，3 AGO)=MGC5)， 则 如 是 分 布 协调 集 ， 如 
果 B 的 任何 真子 集 都 不 是 分 布 协调 集 ， 则 必定 是 分 布 约 简 集 。 
b) 对 VieU ,71s(*5)=714(*%) , 则 B 是 最 大 分 布 协调 集 ， 
如 果 B 的 任何 真子 集 都 不 是 最 大 分 布 协 调集 ， 则 必定 是 最 大 分 
布 约 简 集 。 
c) 对 VieU ，3 65(%%)=64(%)， 则 B 是 分 配 协调 集 ， 如 
果 B 的 任何 真子 集 都 不 是 分 配 协调 集 ， 则 必定 是 分 配 约 简 集 。 
定义 1 和 2 可 知 ， 分 布 协调 集 指 决策 类 上 分 布 函数 保持 
不 变 的 属性 集 ， 最 大 分 布 协调 集 指 最 大 分 布 决策 类 保持 不 变 的 
属性 集 ， 而 分 配 协调 集 指 所 有 对 象 的 决策 类 保持 不 变 。 
定理 1 设 (U,A,f,d) 为 不 协调 决策 信息 系统 ，BcA, 如 
果 B 是 分 布 协调 集 ， 则 必定 是 最 大 分 布 协调 外 
证 明 假设 B 是 (V0,A,f,d) 的 分 布 协调 集 ， 根 据 定 义 2 的 
a),， 对 VieU，BcA ，3AGO0)=AG) (WeU)， 有 
D(D,; /1[%]s)= DCD; VM[%]4) (Vj < nn) 成立。 由 定义 2 的 b) 可 知 ， 
71s(%)=714(%%) (XeU) 成 立 ， 因此 B 是 最 大 分 布 协调 集 。 
定理 2 设 (U,A,f,d) 为 不 协调 决策 信息 系统 ，B cA, 如 
果 B 是 分 布 协调 集 ， 则 B 必定 是 分 配 协调 集 。 
证 明 一 方面 ,假设 B 是 分 布 协 调集 ， 则 对 Vx EU ， 
BcA， 根据 分 不 协调 集 的 定义 ， 有 Ks(%)=A4(%) ， 即 
DD,/[x]s)= D(D,/[x]s), (Vi<r), 
另 一 方面 ， 假 设 De 0s(%) ， 则 由 分 配 函 数 的 定义 ， 可 知 
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表 1 决策 信息 系统 


U al 02 d 
a 1 1 1 
了 1 1 1 
了 1 2 1 
1 2 1 
x 1 2 2 
x6 2 2 
显然 ，Rs 9 Rl， 因此 (VU,A,F,d) 为 不 协调 决策 信息 系统 ， 


并 且 


Re ={ {XX Ks, Xa, Xs}, {Xe} } » 


R,, ={{%, xX}, {XX Xs, Xe}}, 


于 是 得 到 决策 分 布 函 数 为 : 


HW) = 4(%) =(1,0), 4(%) = 人) = Hxs) =(0.67,0.33), 


Ha(Xe) =(0,1); 


Ha (X) Ha (%,) Ha (%) Ha (xX) Ha (Xs) (0.8,0.2), Ha (X¢) 


=(0,1); 


Ks, (X41) = La, OpD) =(1,0), Ho, 0) = Hs, (Kh) = 


=(0.5,0.5); 


Ha, (xs) Ha, (Xe) 


最 大 分 布 函 数 为 74(%)=7T4(%)=714(%)= 4(X4) = 14(Xs) 


{D} ,74(X6)={D,} 


Ma Co) Ma (%) Ma Go) UR Co) UR (Xs) {D,} » 11 (6) {D,} 


Na, (x0) Na, Co) {D.} , Na, Co) Na, (x4) 
{D,D,} 


Nn 


7 
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2 ”知识 约 简 理论 分 析 


不 协调 决策 信息 系统 (UV,A,f,d)，, 对 VX eU， 根据 上 述 有 


Na, (Xs) = 1 (Xe) 


定义 2 可 知 ，A 属于 分 布 约 简 集 ， 但 不 是 最 大 分 布 约 简 


关 定 义 和 定 理 ， 可 以 准确 区 分 属性 子 集 的 约 简 性 和 协调 性 。 下 


面 首先 给 出 分 布 区 分 对 象 集 对 概念 及 其 性 质 定理 。 


定义 311214 设 (U, A,F,d) 为 不 协调 决策 信 息 系 统 ， 


U/ R, ={[x],[% a, [x]a} 


3» 


La(¥)=(DD, VD] DD, / {x1a),…, DOD, 15] (VX EU), 


M4(%)={Din| D(CDio/[%]4) =max D(D;/[%]4)} ， 其 分 布 区 分 对 


Dwls 如， 因此 D(D;1[x%1s)z#0， 于 是 D(D)/[w14)#0， 
从 而 DjnI%Jaz# 多 。 因 此 ，Dje64(%) ， 于 是 就 有 
os()os(6) 。 而 当 BE A 时 ，Rs 二 R，， 对 VrheU ， 存 在 
[5 二 [5 ， 即 200)=O0)，vsU ， 因此 B 一 定 是 分 布 
协调 集 。 

例 1 决策 信息 系统 如 表 1 所 示 。 

按照 分 类 等 价 关 系 有 : 

U/R, ={{X,%), {XX Xs}, {Xe}}, 
U/R,={{X,%,X, Xa), {Xs, Xe}} 


象 集 对 、 最 大 分 布 区 分 对 象 集 对 分 别 定义 为 


D;, ={(x a x) | 4%) #44 x))} (4) 
D; ={(t% lx mC) #7 x))} (5) 

定义 4025 设 (U0,4,F,4) 为 不 协调 决策 信息 系统 ， 
U/R,={C,G,…,C,} ， 所 (CG) 表示 a 关于 Ci 的 值 。 


a) 记 


他 
则 定义 Ms ={D,(C,Cj),ij < 贡 为 分 布 


ao-| 


{a | A E 4, fa (Ci) 天 fo (Ci 


区 分 矩阵 。 


) (CCi)es 亡 
(GC,C)¢D; 


录用 稿 


b) 记 


aco)-| 


则 定义 1 ={Di(Ci,C),i,j < m} 为 最 大 分 布 区 分 矩阵 。 


显然 ， 定 义 4 是 在 定义 2 基础 
上 述 定义 易 知 下 列 性 质 和 定理 。 
性 质 1 设 (VU,4,F,d) 为 不 协 j 
U/R,={C,C,…,C,} ， 易 知 


m 


a) MM 、M, 为 对 称 和 
D,(C,C)=D,(C,C), Vijsm; 


{a la eA,f, (C)#f,(C)) (GC,C)eD, 


(GC,C) epD; 


决策 信息 系统 ， 


步 拓展 和 延伸 。 


有 以 下 性 质 : 
即 D,(C,C))=D,(C,,C) 


b) MWM  、M 对 角 线 上 元 素 都 为 4， 


D(C,C)=D,(C,C)=A, Vi<m; 


cj D,(C,C) ED,(C,C)UD (CC), Vik,j<m 


D,(C,C)) ED,(C,C) UD, 


= 


BcA > 则 有 : 


a) B 为 分 布 协调 集 


BND,(C,C) #8 ., 


b) B 为 最 大 分 布 协调 集 当 


BMD,(C,C)) #8. 


记 C=[xX]a ) C, =[x,]a » 


qeB ， 使 得 fi(%)z (Xj) ， 
EeD,(Ci,C)) 成 立 。 从 而 ， 结 论 

必要 性 ,假设 3 (GC,C,)eD,， 
记 C=D ， C=[%j4， 则 
Ha( 加 ) 关 Ma(Xj) 。 对 于 Var EB， 必然 3 4 D(Ci,Cj;) ， 使 得 
(CG)=(C)) ， 即 天 (5)= (xX)) ， 这 说 明 [X]s =[xj;]s ， 根 扩 
定义 2 的 a) 可 知 B 不 为 分 布 协 1 

b) 充分 性 。 假设 B 为 最 大 分 
记 G=[%]j4 ，C;=[Xjja ， 则 
Aa(H) 半 Ha(Xj) 。 根据 定义 2 的 b) 可 和 
a eB ， 使 得 fh(%)z 甩 (x)) ， 
QE D(C,C)) 成 立 。 从 而 ， 结 论 

必要 性 ,假设 3 (GC,C))eD;， 
记 G=[X]4，Cj=[xXj]js， 则 根 ] 
HA) 了 M4(X)) 。 对 于 Var eB， 必 然 3 QD,(C,C)) ， 使 得 
(CG)=f(C)) ， 即 到 (7)= (Xx)) ， 这 说 明 [X]s=[xj]s， 栓 
定义 2 的 b) 可 知 ，B 不 为 最 大 分 布 

定理 3 实质 上 给 出 了 判定 不 协 记 


人 否 协调 的 理论 依据 。 


定义 S$0253 设 (4,PF,d) 为 不 协调 决策 信息 系统 ， 


CisC) ,Vik, jm 


定理 3 设 (0,4,f,d) 为 不 协调 决策 信息 系统 ， 对 于 YY 


仅 当 对 V(G,C)eD; ，3 


当 对 V(G,C))eD, ，3 


外 


证 明 a) 充 分 性 ,假设 B 为 分 布 协 i 


| 


办 调 细 


。 证 毕 。 


的 定义 ， 可 


5 时 


协调 身 
HDL = 
1 fi(C)zAh(C) 1 因 T 
BMD,(Ci,C))z 名 成 立 。 
得 8mD,(G,C))=2 成 立 ， 
昌 分 布 协调 集 的 定义 ， 可 知 


办 调集 。 


,车 V(G,,C)) es 六 ， 
长 的 定义 ， 知 
MG0) 关 Mo5) 。 根 据 定义 2 的 a) 可 知 [5 = 纪 。 则 习 


1 (GCG)fi(C)) ， 因 而 有 
BMD,(C,C))z 名 成立。 
BMAD,(C,C))= 名 成 立 ， 
分 布 协调 身 


j 集 , 阁 Y(C Cs 也， 
长 的 定义 可 知 
则 了 


月 


定理 4 


(Gi,C)) 
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{VDC Cj (9) 


(G a en (9) 
设 (0,4,P,d) 为 不 协调 决策 信息 系统 ，, 最 小 析 


取 范 式 简 记 为 =V{ 和 Ag} ， 著 脉 ={41i=12… 由 ， 则 


B. MND,(C,C)) 名 ， 根 ] 


及 于 M(B) 从 B. 9 


则 
B 


{B. |k=12,…,m} 包含 所 有 最 大 分 布 约 简 集 。 
证 明 对 Vk<m, (GC,C))eD,，, 由 最 小 析 取 范式 的 定义 知 


B.D,(C,,C))z 儿 ,根据 定理 3 (2), 可 知 B 为 最 大 分 布 协 调 


大 


或 或 
5 


了 xx eU 3 且 Ci =[xX]a > C, =[x,]a (GC,,C))eD, 使 


定理 5 


mt 
o 


居 定 理 3a) 可知 B 为 分 布 协调 集 。 若 


Ph 任意 约 去 元 素 4 成 为 B, 即 B=B 一 {4}， 


1 


.站 D,(G,C))= 名 ， 则 Bi 不 是 分 布 协 调集 ， 从 而 B 是 分 布 约 
。 而 区 分 公式 i 包括 所 有 Ds(Ci,C)) ， 因 此 不 含 其 他 分 布 约 


设 (U,A,F,d) 为 不 协调 决策 信息 系统 ， 最 小 析 


取 范 式 简 记 为 = Vv{A 0} » 若 B={a|i=1,2,.…,n} 9 则 


. 若 羽 =V(B) 从 B 中 任意 约 去 元 素 4 成 为 妒 ， 即 


B, =B, —{a,} ， 则 了 EU 二 . 肯 C=[xX]a » C;=[x;] » 
(Ci,C))e 


焦 


A 


种 相对 约 


不 协调 决策 信息 系统 的 知识 约 简 方法 


3 


3.1 


算法 原理 与 描述 
根据 久 


定理 


论 分 析 , 一 方 本 


可 以 计算 不 协 


证 毕 。 


U/R, ={C,C,…,C,} , 则 则 
分 别 定 义 为 


言 息 系统 属性 子 集 是 


区 分 公式 、 最 大 分 布 区 分 公式 


区 分 对 象 自 
5、 定 理 4 和 5， 


吏 B.D,(G,C)) = 名， 则 Bi 不 是 最 大 分 布 协调 
从 而 B 是 最 大 分 布 约 简 。 而 最 大 区 分 公式 包括 
其 他 最 大 分 布 约 简 。 
| 给 出 了 利用 分 布 区 分 公式 和 最 大 分 布 区 分 
其 最 小 析 取 范 式 ， 可 以 确定 不 协调 决策 信息 系统 各 


工 


所 有 


,由 定义 3 和 4 可 知 ， 


言 息 系统 的 分 布 区 分 对 象 集 对 和 最 大 分 布 


区 分 对 象 属性 集 ; 另 一 方面 ,根据 定义 


以 构建 分 布 区 分 矩阵 和 最 大 分 布 区 分 矩阵 ， 


通过 计算 最 小 析 
定义 及 性 质 定型 
法 ， 具 体 算法 过 程 描述 如 下 : 

于 分 布 区 分 对 象 集 的 知识 约 简 算法 


入 


算法 1 


范式 ， 得 出 所 有 相对 约 简 集 。 依 据 上 述 有 关 
E， 设 计 一 种 基于 分 布 区 分 对 象 集 的 知识 约 简 算 


输入 : 不 协调 决策 信息 系统 S=(U,A,F,d) 


输出 : 


EReduction 


) 对 于 5=(U,4,F,d) 中 VieU ， 计算 [%]4: 
b) 对 于 S$S=(U,A,F,d) 中 Vx eU ， 计算 决策 等 价 类 [Xj]y: 
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国 
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U/R,={D,D,,…,D,}={(%,x)) eU xU|d(x)= d(x))}: 

oc) 计算 $=(U,A,F,d) 的 分 布 约 简 人 

(a) 根 据 定义 1， 对 VieU ， 求 解 心 (5) : 

La(%) = (DD /Lx]), DD, /[x,]),*…, D(CD, / [1x11)): 

(b) 计 算 D, 得 分 布 区 分 对 象 集 的 集 对 DD; 
D, ={([x [2x14) HN) z M(x)} 

(0) 根 据 分 布 区 分 对 象 集 的 集 对 计算 分 布 区 分 属性 
D,(C,,C)): 


nt 


3 


Nn 


uy 


{a la eA,fs (C)#1,C) (CC)eD, 
名 (GC,C)¢D, 
分 矩阵 MM : 


nicei=| 


[Bal 


(d) 根 据 D,(Ci,C)) 计 算 分 布 


M,= 人 {VD,(C,C)}= 人 {YD,(C,C))} 
4 4 7 (Chemy 4 i71， 


人 计算 瓦 = Y{Aaj} 的 最 小 析 取 范式 ， 得 分 布 约 简 集 P” ; 


dj) 计算 $=(U,A, 了 ,qd) 的 最 大 分 布 约 简 绰 
(a) 根 据 定义 1 ， 对 于 Vx EL ， 求解 14a(X) 


mt 


ma(%)={Do | D(D,o /x1a) =max D(D, /[x]a)} 5 


(x EeU); 
(b) 计 算 D; 得 最 大 分 布 区 分 对 象 集 的 
D, ={([x lx]a) |774(%)z max))} ; 
(0) 根 据 最 大 分 布 区 分 对 象 集 的 集 对 计算 最 大 分 布 区 分 属 
性 集 D(Ci,C)); 


tot 

> 
| 

已 


{a |ar eA,f, (C)#f,(C)) (CG,C)eD; 
人 (GC,C) ¢D;» 
(qd) 根据 D,(Ci,C)) 计算 最 大 分 布 区 分 矩阵 


M,=A{VvD,(C,C)}= 入 {vDI(CCC))) 
了 而 Ce (GC )eD; 人 


pc.c-| 


(©) 计算 巨 =V{ 人 a 的 最 小 析 取 范式 ， 得 所 有 最 大 分 布 约 


简 集 书 ” ; 

9 输出 Pr 和 Pm" 。 
3.2 算法 分 析 

1) 时 间 复 杂 度 分 忆 

步骤 a) 和 b) 的 时 间 开 销 为 0(U|。 对 于 步 又 c) 中 ,(a)(b) 可 
在 时 间 复 杂 度 O(|UP) 内 完成 ; (ce) 时间 复杂 度 为 0( D;1.| C0; 
(d)(e) 时 间 复 杂 度 接近 于 O(U|) ; 步骤 dd) 中 ，(a) 的 时 间 复 杂 度 
为 O( 44(DD ; (b) 的 时 间 复 杂 度 为 O( UP) ; (ce) 的 时 间 复 杂 度 
为 0(D;|.|CD ; (e)(D 可 在 时 间 复 杂 度 Od UP) 内 完成 。 因此 ， 
本 算法 总 的 时 间 复 杂 度 为 max{O(U[),.0( Di|.|CD}。 

2) 空间 复杂 度 分 析 

算法 1 的 空间 复杂 度 为 max{O(|UlCD,00 D1|.|CD}。 

与 算法 1 相 比 ， 文 献 [10] 中 采用 的 属性 约 简 算法 的 时 间 复 
杂 度 取决 于 广义 分 配 辨 识 和 矩阵 约 简 算法 的 时 间 复 杂 度 ， 为 


3 
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系统 的 属性 约 简 时 ， 需 要 构建 决策 系统 的 区 分 矩阵 来 存储 差别 
遇 性 ， 因 而 占用 较 大 的 存储 空间 ， 即 算法 的 空间 复杂 度 为 
OUdcCl.|2 六 。 显 然 , 与 目前 常用 的 属性 约 简 算法 相 比 较 ， 本 文 
算法 在 时 间 复 杂 度 和 空间 复杂 度 上 都 具有 较 大 的 优势 ， 并 且 能 
够 求 出 系统 所 有 分 布 约 简 集 和 最 大 分 布 约 简 集 。 


4 ”基于 分 布 约 简 算法 的 决策 规则 获取 


不 协调 决策 信息 系统 的 决策 规则 获取 是 在 属性 约 简 基 础 上 
归纳 出 条 件 属性 和 决策 属性 之 间 的 关联 关系 。 在 决策 规则 获取 
过 程 中 ,决策 规则 的 前 件 表示 属性 集 描述 ,后 件 对 应 决策 结论 。 
设 5=(U,A,Ff,d) 为 不 协调 决策 信息 系统 ，BSE4，4d={d)， 
U/R, ={d,d;,,…d,} ， 则 决策 规则 可 表示 为 : 

:人 (qd,yv) 二 v(d,w) ,其 中 ,aeBCcA,veV,,weV,V 表示 4a 
的 值 域 , VW 表示 4 的 有 限 值 域 。 

x. 的 可 信和 度 因 子 用 C(x) 衡量 

wpa lr al 
4 |[x];| 

其 中 : [xs 为 B 的 等 价 类 , [XJ] 为 4 的 等 价 类 , | ?| 为 集合 基数 。 
易 知 ，C(7.)=1， 表 明 是 确定 规则 ;0< CG)<1， 表 明志 是 
不 确定 规则 。 

定义 6051 设 和 (a,v) 下 Vv(d,w) 为 一 般 决 策 规则 ， 则 称 
Red( 人 (a,v)) 一 v(d,w) 为 优化 决策 规则 。 此 定义 表明 ， 优 化 决 
策 规则 是 确定 性 程度 最 高 且 条 件 属性 描述 最 简洁 的 决策 规则 。 
4.1 不 协调 决策 信息 系统 优化 决策 规则 获取 算法 

根据 不 协调 决策 信息 系统 的 知识 约 简 和 决策 规则 获取 理论 
分 析 ， 从 不 协调 决策 系统 中 提取 决策 规则 就 是 利用 数据 的 分 布 
约 简 和 最 大 分 布 约 简 构造 新 的 决策 表 ， 再 引入 规则 可 信和 度 ， 归 
纳 出 优化 的 决策 规则 。 从 不 协调 决策 信息 系统 中 获取 优化 决策 
规则 具体 算法 如 下 : 

算法 2 基于 分 布 约 简 集 的 优化 决策 规则 获取 算法 

输入 : 不 协调 决策 信息 系统 S=(U,A,F,d) 。 

输出 : 最 优 决 策 规则 集 。 

a) 根 据 算法 1 给 出 的 约 简 算 法 , 计算 $=(U,A4,7,d) 中 所 有 
分 布 约 简 集 "和 最 大 分 布 约 简 集 五 ” ; 

D) 分 别 根 据 Br 和”， 构 建新 决策 信息 系统 
S =(U,A,F,d); 

0c) 规则 获取 与 选择 。 计 算 可 信和 度 ， 当 可 信和 度 达 到 设 定 的 病 
值 时 ， 提 取 S =(U,A,F,qd) 中 所 有 符合 条 件 的 决策 规则 ; 

d) 获 取 最 优 决 策 规 则 。 将 最 后 得 到 的 决策 规则 进行 整合 ， 
分 别 输出 C(7)=1 的 确定 规则 集 和 0< Cr)<1 的 不 确定 规则 
自 


Ws 
1 


} 


A 


uy 
o 


5 ” 算 例 分 析 
为 了 进一步 分 析 本 文 算法 的 有 效 性 ， 表 2 给 出 了 一 个 不 协 


调 决 策 信 息 系 统 S=(U,A4,F,d) ， 其 中 U={%,%%,…,X6}， 


O( CP .IUP) ,计算 过 程 较为 复杂 ,文献 [1 和 在 计算 不 协调 信息 


C={a,w,0,4}, d={d}, 


录用 稿 


表 2 不 协调 决策 信息 系统 


U al 02 03 04 d 
Xl W 2 2 立 1 
X2 2 1 1 2 2 
pz 之 1 和 2 之 1 
X4 2 1 2 2 1 
Xs 2 1 1 1 六 
26 2 1 之 之 2 


a) 根据 算法 1 的 步骤 a)， 可 计算 条 件 


rr 
如 
[EE 


等 价 类 为 


CG=[D= Co=[D= 人 2 ; G=[m)h={m,%,M} ; 


C=[x5]4 = {Xs} 


b) 根据 算法 1 的 步骤 b)， 计 算 决 策 属性 等 价 类 为 : 
di ={X,%,X} ;0 ={%,X, Xe} 


c) 根据 算法 1 的 步骤 c) 计 算 分 布 约 简 : 


(a) 根 据 步 又 c) 中 Ca) 计算 分 布 函数 4(%) 的 值 , i=1,2,…,6， 
Hs)=0,0) ; Co)=(0D ;Ca) = MG = 人 MGO6) = 
(0.67,0.33) ; yu (xs) = (0,D; 


(b) 根 据 步骤 co) 中 (b) 计算 分 布 区 分 对 象 集 对 : 


D, ={(CG,C,),(C,C;),(C,C),(C, CCC) 


0 


(c) 根 据 步 又 c) 中 《〈c) 计算 分 布 区 分 属性 集 : 
D CCC) = {41,4,03}; D (CC3)= {a1,a,}; 
D,(C,C)={4,0,,03,0} ; D(C,C3) = {as}; 

D,(C;,C)={0,44} 

(gd) 根据 步 缀 中 (e)(f)， 计 算 最 小 析 取 范式 : 

F,=(d Va va) A (av a) a 
(a Va Vasva) Nd A(adyv a) l 
因此 ，5 =(U, 4, 了,d) 的 分 布 约 简 集 为 {41,43} 和 {4,,a;} 。 

d) 根据 算法 1 的 步 又 d) 求 最 大 分 布 约 简 : 

(根据 步骤 中 中 (计算 最 大 分 布 函数 75) 的 值 ， 


i=1,2,...,6 


in 


lt 


ma(%)={D}; ms)={D,}; 

ma(%)=7(X%) =74(X6) ={D}; mx)={D,} 
(b) 根 据 步 骤 由 中 (b) 计 算 最 大 分 布 区 分 对 象 的 集 对 : 
记 ={(C,C) (CCC CC CN} 
(c) 根 据 步 又 步骤 由 中 (D 计 算 最 大 分 布 区 分 属性 集 : 
D,(C,C,) ={a,a,,a;} s D(C,C) ={4a,a,,43,44} ; 

D(C,,C,)={4}:; D, (C3,C,) = {a3,44} 

(gd) 根据 步骤 qd) 中 (d) 和 (e)， 计 算 最 小 析 取 范式 : 


b=(ad Vava) 人 


沟 


(@ Va Va va) Na ra va) 
因此 ，5 =(V,4,P,d) 的 最 大 分 布 约 简 为 {4s}。 
e) 根据 算法 2， 基 于 ”={{4,43}} ， 对 应 优化 决策 规则 


过 


1: (GD 入 (42) 一 (GD 
万:(a2) 和 (0 D 一 (d,2) 
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六: (0,2) 入 (02) 一 (dv(d,2) 
基于 Fw ={{43,43}} ， 对 应 优化 决策 规则 有 
fi:(g,2) 人 (a,2) 一 (GD 
»:(g,,) 人 (a;,D) 一 (d,2) 
n:(@,D) 和 (ga,2) > (d,D v(d,2) 
f) 基于 ”={{4}} ， 对 应 优化 决策 规则 集 为 
ni:(a,l) 一 (d,2) 
»:(0,2) 一 (dDV(d,2) 
此 ， 不 协调 决策 信息 系统 S$=(U,A,F,d) 的 分 布 约 简 绒 
B={{41,43},{Q2,43}} ， 最 大 分 布 约 简 集 B={a3} ， 并 且 都 能 够 
从 决策 系统 中 挖掘 出 更 为 优化 的 决策 规则 集 ， 从 而 使 决策 知识 
更 加 科学 合理 


为 


pau 


六 | 
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6 ”结束 语 


本 文 面向 不 协调 决策 信息 系统 ， 引 入 分 布 约 简 和 最 大 分 布 
约 简 概念 ， 获 取 系 统 相对 约 简 集 ， 构 建 了 基于 分 布 区 分 对 象 集 
的 知识 约 简 算法 ， 该 算法 通过 求解 分 布 区 分 对 象 集 集 对 和 最 小 
析 取 范式 从 而 得 到 知识 约 简 集 , 并 能 充分 挖掘 优化 决策 规则 集 ， 
提高 了 决策 规则 获取 算法 效率 ， 为 不 协调 信息 系统 决策 知识 发 
现 提供 了 一 种 新 的 思路 与 方法 ， 实 例 验 证 了 本 文 方法 的 有 效 性 
和 实用 性 。 下 一 步 将 针对 系统 数据 变化 情况 ， 重 点 研究 知识 动 
态 挖掘 及 其 应 用 问题 。 
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